草庐IT

xml - 如何用nokogiri解析xml文件并将结果放入新文件中?

全部标签

ruby - 如何在 Ruby 中有效地解析大文本文件

我正在编写一个导入脚本来处理一个可能有数十万行的文件(日志文件)。使用一个非常简单的方法(如下)占用了足够的时间和内存,我觉得它随时都会耗尽我的MBP,所以我终止了这个过程。#...File.open(file,'r')do|f|f.each_linedo|line|#dostuffheretolineendend这个文件特别有642,868行:$wc-lnginx.log/code/src/myimport642868../nginx.log有谁知道处理此文件中每一行的更有效(内存/cpu)方法吗?更新上面f.each_line中的代码只是将正则表达式与该行进行匹配。如果匹配失败,我

ruby-on-rails - 如何为模型/ View / Controller 以外的文件编写/运行规范

当我对模型/View/Controller使用railsgenerate命令时,使用rails和rspec很容易让rspec为我生成必要的文件。但是现在我想为我编写的模块编写规范。该模块位于/lib/my_module.rb中,因此我在/spec/lib/my_module_spec.rb中创建了一个规范我遇到的问题是,当我尝试执行rspecspec/时,文件my_module_spec.rb已运行,但在中引用了我的模块找不到lib/my_module.rb。执行此操作的正确方法是什么?仅供引用,my_module_spec.rb文件中已经包含require'spec_helper'r

ruby - RVM:在系统范围安装中从 .rvmrc 文件加载 gemset 时权限被拒绝

我创建了一个包含自定义gemset的项目特定.rvmrc文件(使用命令rvm--rvmrc--create1.9.2@registration):#excerptof.rvmrc...environment_id="ruby-1.9.2@registration"if[[-d"${rvm_path:-$HOME/.rvm}/environments"\&&-s"${rvm_path:-$HOME/.rvm}/environments/$environment_id"]]then\."${rvm_path:-$HOME/.rvm}/environments/$environment_id

ruby - 使用 open-uri 和 nokogiri 在完全加载之前读取 HTML

我正在使用open-uri和nokogiri以及ruby​​来进行一些简单的网络爬虫。有一个问题,有时html在完全加载之前就被读取了。在这种情况下,我无法获取加载图标和导航栏以外的任何内容。告诉open-uri或nokogiri等待页面完全加载的最佳方法是什么?目前我的脚本是这样的:require'nokogiri'require'open-uri'url="https://www.the-page-i-wanna-crawl.com"doc=Nokogiri::HTML(open(url,ssl_verify_mode:OpenSSL::SSL::VERIFY_NONE))puts

ruby - 如何通过 ARGV 打印我正在使用的文件的行号?

我目前正在打开一个在运行时通过ARGV获取的文件:File.open(ARGV[0])do|f|f.each_linedo|line|找到匹配项后,我将输出打印给用户。ifline.match(/(strcpy)/i)puts"[!]strcpydoesnotcheckforbufferoverflowswhencopyingtodestination."puts"[!]Considerusingstrncpyorstrlcpy(warning,strncpyiseasilymisused)."puts"#{line}"end我想知道如何打印出(ARGV[0])文件中匹配行的行号。使用

ruby-on-rails - 已安装 gem 但无法加载此类文件

我做了以下事情geminstallcrack并添加了gem'crack'到我的gemfile。然后我需要require'crack'我尝试加载路线时遇到的错误是cannotloadsuchfile--crack我已经运行了gem环境并得到以下内容RubyGemsEnvironment:-RUBYGEMSVERSION:2.2.2-RUBYVERSION:2.1.0(2013-12-25patchlevel0)[x86_64-darwin12.0]-INSTALLATIONDIRECTORY:/Users/joshuahornby/.rvm/gems/ruby-2.1.0-RUBYEXE

ruby-on-rails - Rails 4 - 如何链接到 PDF 文件 (name.PDF)?

我正在生成PDF文件,我的链接如下所示::pdf%>当我点击它时,它会将我带到/display_invoice/123456789(这是一个HTML版本)。ControllerAction如下:defdisplay_invoiceifparams[:invoice_number]@invoice=...respond_todo|format|format.htmlformat.pdfdo#renderpdf:'123',#filenamerenderpdf:params[:invoice_number],layout:'layouts/application.pdf.erb'#,#la

ruby - 哪个是 ANTLR 在 ruby​​ 中创建解析器的最佳对应物?

我使用antlr和javacc/freecc有一段时间了。现在我需要使用antlr语法编写一堆解析器,但此类解析器需要用ruby​​lang编写。我用谷歌搜索但没有找到。是否有任何采用antlr语法并创建解析器的ruby​​解析器生成器?如果有很多,您认为哪个是最好的?TIA保罗 最佳答案 您可以使用JRuby轻松逃脱并将您的ANTLR解析器保存在java中。如果PEGs足以胜任你的工作,treetop和更新的citrus是ruby​​ists使用的常用工具。我在研究项目时挖掘的其他解析器是:peggy,Kanocc,Racc.对于

ruby - Vpim::Vcard - 解析 vcard 2.1

我的代码必须解析Vcard2.1格式。我正在使用vpim(没有其他库)当我运行Vpim::Vcard.decode(data)时出现错误:undefinedmethod`each'for#堆栈跟踪:NoMethodError(undefinedmethod`each'for#):vpim(0.695)lib/vpim/rfc2425.rb:82:in`unfold'vpim(0.695)lib/vpim/rfc2425.rb:308:in`decode'vpim(0.695)lib/vpim/vcard.rb:692:in`decode'app/models/event.rb:71:i

ruby - 在未安装 Excel 的服务器上使用 Ruby 读写 Excel 文件

我需要在一台没有安装Excel的Linux服务器上读写(->转换)Excel文件。对于Python,存在http://www.python-excel.org/.Ruby有类似的东西吗?可能不需要处理最新的Office格式。只需旧的xls文件就足够了。 最佳答案 我同意Gonzih的观点,并且我经常使用roo。它允许我使用模板文件进行读取、写入和写入。该项目在他们的site上有很好的记录。.我总是使用类似的东西:input=Excel.new(path)output=Array.newinput.default_sheet=inpu